بازشناسی گوینده وابسته به متن

thesis
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی
  • author عزیزه راستگار
  • adviser فرشاد الماس گنج
  • Number of pages: First 15 pages
  • publication year 1386
abstract

دراین تحقیق طراحی و بکارگیری سیستمهای بازشناسی گوینده ارائه شده است. بازشناسی گوینده، استفاده از یک ماشین جهت بازشناسی یک شخص از یک عبارت بیان شده است. این سیستمها می توانند به دو روش عمل کنند : شناسایی یک شخص بخصوص یا تآیید ادعای شخص مدعی، شناسایی یک شخص با استفاده از ویژگیهای فیزیکی از قبیل گفتار، نمونه ای از اهمیت تجاری در زمینه امنیتی است. بازشناسی گفتار یک روش شناسایی شخص، مبتنی بر استخراج مشخصه از لغات صحبت شده و سپس طبقه بندی آنها بصورت وابسته به یک شخص است. هدف از اجرای این پروژه، بکارگیری سیستمی است که قادر به شناسایی یک شخص از نمونه گفتارش باشد. نتایج حاصل از این کار برای سیستم های وابسته به متن و مستقل از متن صادق می باشد. مشخصات بکارگرفته شده توسط این سیستم که دو نمونه گفتار را مقایسه می کند عبارتند از : تخمین pitch، اطلاعات طیفی (ضرائب ویولت) و ضرائب مل کپستروم. این مشخصات جهت ایجاد خصوصیات گفتار به کار می روند که در یک پایگاه داده ذخیره می گردند. در مرحله بعدی از یک نمونه گفتار تست با استفاده از الگوریتم های مذکور ویژگیها استخراج گردیده و با ویژگیهای گفتار ذخیره شده در پایگاه داده توسط شبکه عصبی مقایسه می شود و نتایج حاصله که حاکی از شخص شناسایی شده می باشد بدست می آید. در روش وابسته به متن انجام گرفته در این پروژه، یک گروه 30نفری از مرد وزن مورد آزمایش قرار گرفتند و برای روش مستقل از متن، از 50 گوینده دادگان فارس دات استفاده گردید. نتایج حاصل از بازشناسی، برای روش اول 100 درصد صحت بازشناسی و برای روش دوم 4 درصد خطا را نشان می دهند که در مقایسه با روش mfcc تقریبا 4 درصد بهبود حاصل گردیده است. برای افزایش درصد بازشناسی می توان از ترکیب ویژگیهای استخراج شده استفاده نمود. همچنین در این پروژه استفاده از ویژگیهای prosody باعث کاهش خطا در بازشناسی در حدود 10 درصد شده است.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

مدلسازی وابسته به متن در بازشناسی گفتار پیوسته بر اساس در خت تصمیم گیری آوایی فارسی

مدلسازی وابسته به متن به عنوان شیوه ای مفید برای افزایش دقت مدلسازی در بازشناسی گفتار پیوسته مورد توجه است. معمولترین شکل پیاده سازی این شیوه، استفاده از مدلهای سه آوایی است. با این همه، تعداد زیاد این مدلها موجب می شود که در عمل، آموزش سیستم با مشکلات زیادی همراه باشد و دستیابی به آموزش مقاوم (robust training) به سختی میسر گشته یا اصولا مقدور نشود. یکی از شیوه های حل این مشکل، استفاده از روش گ...

full text

رتبه‌بندی واج‌های گفتار فارسی از نظر کارآیی در بازشناسی گوینده

در این مقاله، کارآیی واج­های گفتار فارسی از نظر بازشناسی گوینده مورد مطالعه و پژوهش قرار گرفته و با توجه به میزان کارآیی­ها، رتبه­بندی واج­ها صورت گرفته‌اند. جهت برآورد کارآیی واج­ها، از یک معیاری که به­صورت نسب « فاصلة بین­گوینده­ای» واج­ها به « فاصلة در گوینده‌ای» تعریف شده است و ما آن را « نسبت تأثیرپذیری گوینده » نامیده­ایم، استفاده شده است.­ آزمایش­ها و محاسبات لازم برای کلیه واج­های گفتار...

full text

طبقه‌بندی شورایی تطبیقی برای تصدیق گوینده مستقل از متن

این مقاله مسئله طبقه‌بندی شورایی را برای تصدیق گوینده مستقل از متن بررسی می‌کند. ازآنجاکه ممکن است یک طبقه‌بند از اطلاعات مختلف سیگنال گفتار بهره نبرد، استفاده از یک طبقه‌بند برای تصدیق گوینده ممکن است منجر به تصمیم قابل‌اعتمادی نشود. بنابراین بهترین سامانه‌های تصدیق گوینده از مجموعه‌ای از طبقه‌بندهای مکمل برای رسیدن به تصمیمات قابل‌اعتماد استفاده می‌کنند. در اکثر مطالعات اخیر که روی ترکیب طبقه...

full text

بازشناسی گوینده مستقل از متن براساس گفتار تلفنی توسط شبکه های عصبی

در این پایان نامه سیستمی به منظور بازشناسی هویت گوینده مستقل از متن براساس گفتار تلفنی و به کمک شبکه های عصبی طراحی و پیاده سازی شده است . جهت این کار از دو دادگان گفتار زبان فارسی farsdat و tfarsdat استفاده شده است .

15 صفحه اول

طبقه بندی شورایی تطبیقی برای تصدیق گوینده مستقل از متن

این مقاله مسئله طبقه بندی شورایی را برای تصدیق گوینده مستقل از متن بررسی می کند. ازآنجاکه ممکن است یک طبقه بند از اطلاعات مختلف سیگنال گفتار بهره نبرد، استفاده از یک طبقه بند برای تصدیق گوینده ممکن است منجر به تصمیم قابل اعتمادی نشود. بنابراین بهترین سامانه های تصدیق گوینده از مجموعه ای از طبقه بندهای مکمل برای رسیدن به تصمیمات قابل اعتماد استفاده می کنند. در اکثر مطالعات اخیر که روی ترکیب طبقه...

full text

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023